Спецкурс MаLы DаLи
Основная информация
  Пункт Содержание
1 Направление Третий Путь
2 Класс 10 - 11
3 Тип курса зачётный только для 10-11-ти классников
4 Преподаватели Куратцев Владимир, Кадерова Надия
5 Стажёры  
6 Время проведения Среда 18:55 - 20:15
7 Цель курса Познакомить школьников с основами науки о данных (Data Science) и научить применять знания на практике с конкретными типами задач из Machine Learning и Deep Learning 
8 Задачи курса 1. Дать общее представление об истории Data Science
2. Познакомить с основами Python для Data Science
3. Познакомить с основами Data Science (ML,DL)
4. Познакомить с разными типами задач и примерами их решения
5. Дать возможность самостоятельной реализации задач и проектов по Data Science с поддержкой преподавателей
9 Особенности курса Адаптированный для школьников курс по Data Science (Machine Learning и Deep Learning). Возможность практики на конкретных задачах и реализации своего проекта с поддержкой преподавателей. Для прохождения курса необходимо наличие дома доступа к компьютеру и интернету. По желанию школьников можно приносить на занятия ноутбук для отработки навыков параллельно лекции 
10 Формат проведения занятия (включая использование classroom) 1) Совмещенный формат: лекция + семинар. Лекционный материал от преподавателя, разбор кода и параллельное его написание школьниками в компьютерном классе;
2) Особые виды занятий (экзамен или чаепитие)
11 Целевая аудитория Школьники 10-11 классов, заинтересованные в изучении Data Science и имеющие уверенные знания в математике и программировании
12 Краткое описание курса Адаптированный для школьников 10-11 классов курс науки о данных (Data Science)
13 Количество слушателей от 10 до 20 человек
14 Отбор Отбор будет. Письменная работа из задач по математике, информатике, программированию. Задания не привязаны к конкретному языку программированию
15 Формы контроля и
система отчётности
1. Посещение - 20%
2. Домашняя работа (мини-задачи для практики на основе пройденного материала) - 30%
3. Письменный экзамен - 20%
4. Проект (самостоятельная практическая работа, посвященная решению одного из разобранных на лекциях типов задач на конкретном примере данных) - 30%
16 Формат курса: онлайн/оффлайн/гибрид. В случае онлайн, какие платформы используются? оффлайн
20 Дополнительная информация о курсе  
Позанятийный план
№ занятия Дата (Среда) Тематический блок План занятия
1 02.10.2024 Введение. Отбор. Обсуждение организационных вопросов. Проведение отбора.
2 09.10.2024 Введение Введение в историю науки о данных, ее структура и методы.
3 16.10.2024 Python Вводное занятие по программированию. Организация работы в компьютерном классе. Google Collab. Anaconda и Jupiter Notebook. Работа с нейросетью (например, Phind, GigaChat) для помощи с написанием кода. 
4 23.10.2024 Python Основы синтаксиса. Переменные и типы данных. Математические операции.
5 30.10.2024 Python Основные структуры: условные конструкции, циклы и функции. Библиотека pandas. Предобработка данных: работа с пропусками.
6 06.11.2024 Python Предобработка данных: работа с типами данных, дубликатами. Библиотека matplotlib. Основы визуализации данных.
7 13.11.2024 Элементы математической статистики Введение в статистику: вероятность, случайные величины и их распределения, математическое ожидание, дисперсия, медиана, ковариация, корреляция, регрессия.
8 20.11.2024 Элементы математической статистики Выборочные характеристики, точечные оценки и их свойства. Методы построения оценок: ММ, ММП, МНК.
9 27.11.2024 Машинное обучение Введение в машинное обучение. Задача регрессии. Библиотека scikit-learn. Разбиение данных на выборки. Линейная регрессия. Оценка качества модели регрессии.
10 04.12.2024 Машинное обучение Обработка количественных и категориальных признаков. Анализ ошибок модели. Дедлайн №1 по выбору задачи.
11 11.12.2024 Машинное обучение Задача классификации. Логистическая регрессия. Оценка качества модели классификации. Дедлайн №2 по структуре проекта.
12 18.12.2024 Машинное обучение Метод опорных векторов. Дерево решений. Дедлайн №3 по коду проекта.  
13 25.12.2024 Машинное обучение Переобучение и недообучение. Регуляризация. Решения проблемы дисбаланса классов. Кросс-валидация. Дедлайн №4 по результатам.
  01.01.2025 -  
  08.01.2025 -  
14 15.01.2025 Экзамен Защита проекта (выступление с презентацией) и письменный экзамен
15 22.01.2025 Чаепитие Чаепитие
16 29.01.2025 Машинное обучение Задача понижения размерности. Проклятие размерности. Метод главных компонент. t-SNE.
17 05.02.2025 Машинное обучение Задача кластеризации. Сложности постановки задачи. Метод K-Means.
18 12.02.2025 Машинное обучение Иеархическая кластеризация. DBSCAN.
  19.02.2025 -  
19 26.02.2025 Глубокое обучение Введение в нейронные сети. Структура нейрона. Определение нейронной сети. Виды нейронных сетей. Полносвязные нейронные сети.
20 05.03.2025 Глубокое обучение Сверточные нейронные сети (CNN). Архитектура CNN. Введение в библиотеку PyTorch. Решение задачи классификации с помощью нейронных сетей.
21 12.03.2025 Глубокое обучение Реализация CNN для задачи классификации в выбранном фреймворке. Оценка модели.
22 19.03.2025 Глубокое обучение Задача распознавания звуков. Особенности и характерные признаки. Принцип работы CNN при обработке аудиоданных.
23 26.03.2025 Глубокое обучение Реализация CNN для задачи распознавания звуков в выбранном фреймворке. Оценка модели. Эксперименты с различными параметрами. Дедлайн №1 по выбору задачи.
24 02.04.2025 Глубокое обучение Структура нейронной сети для задачи регрессии. Роль активационных функций. Описание архитектур для регрессии. Применение выбранной модели для решения задачи регрессии. Оценка точности и других метрик качества. Дедлайн №2 по структуре проекта.
25 09.04.2025 Глубокое обучение Определение временного ряда. Основные статистические характеристики временных рядов. Реккурентные нейронные сети. Принцип работы, особенности и преимущества. Применение обученной нейронной сети для прогнозирования временного ряда. Оценка производительности модели и сравнение со статистическими методами. Дедлайн №3 по коду проекта. 
26 16.04.2025 Глубокое обучение Определение автоэнкодера. Назначение автоэнкодера. Архитектура автоэнкодера. Метрики оценки качества сжатия. Примеры использования автоэнкодеров для сжатия изображений. Дедлайн №4 по результатам.
27 23.04.2025 Глубокое обучение Защита проекта (выступление с презентацией) и письменный экзамен
28 30.04.2025 Глубокое обучение Чаепитие
  07.05.2025    
  14.05.2025    
  21.05.2025    
  28.05.2025    
  04.06.2025    
  11.06.2025    
  18.06.2025    
  25.06.2025    
Список используемой и рекомендованной литературы
1 Билл Л. Простой Python. Современный стиль программирования.
2 Брантон С. Л., Куц Д. Н. Анализ данных в науке и технике.
3 Дайзенрот М. и др. Математика в машинном обучении.
4 Джоэл Г. Data Science: Наука о данных с нуля.
5 Кадурин А., Николенко С., Архангельская Е. Глубокое обучение. Погружение в мир нейронных сетей.
6 Коул и др. Искусственный интеллект и компьютерное зрение. Реальные проекты на Python, Keras и TensorFlow.
7 Мюллер, Массарон: Глубокое обучение для чайников.
8 Савельев В. Статистика и котики.
9 Фостер Д. Генеративное глубокое обучение. Как не мы рисуем картины, пишем романы и музыку.
10 https://pythontutor.com/  
11 https://www.codecamp.ru/tag/pythontuts/
12 https://education.yandex.ru/handbook